查看原文
其他

包菜、西兰花、花椰菜你知道它们都是甘蓝吗?

大项目部-胡晓晓 华大科技BGITech 2019-05-10
180+篇植物基因组文章解读大全

第二章 十字花科

地表最强植物基因组文献解读,正在继续。科技君和小伙伴们特地对植物基因组领域已发的180多篇高质量文章进行收集、解读和归类,经归纳整理后共分十章,前九章为相关领域已发表物种文献解读,最后一章为植物基因组未来发展趋势及预测。

十字花科往期回顾

玛卡 ◆ 甘蓝型油菜 ◆ 白萝卜 ◆ 条叶蓝芥 ◆ 白菜



导读

说起甘蓝,其实也是一种命运多舛的物种。人们如今食用的是它的结球,而最初的野生甘蓝是没有结球这一特征的,人类为了想要吃甘蓝的叶子,所以陆续培育出了包菜、紫甘蓝等作物。而后又觉得它的花应该也不错,就又有了花椰菜、西兰花,这些都统称为甘蓝类蔬菜。本期植物基因组解读,科技君与带大家一同了解一下甘蓝基因组。


文献题目:The Brassica oleracea genome reveals the asymmetrical evolution of polyploid genomes


发表期刊: Nature Communications


发表时间:2014年5月23日


影响因子:10.1038


摘要介绍:本文研究了甘蓝的基因组序列草图,并对甘蓝和其近缘物种白菜进行比较,发现了大量染色体重排和不对称复制基因块丢失,基因差异表达包括大量旁系同源和直系同源基因的可变剪接,转录因子不对称扩增为特定通路保留基因。与抗肿瘤植物化学物质产量以及形态学变化相关的基因阐明了基因组复制和基因分化的结果。这项研究提供了对芸苔属基因组进化的最新发现,将对这个属中许多重要作物的研究提供帮助。


研究意义:与近缘种芸苔基因组比较,发现了芸苔属植物基因组进化和分化的动力和芸苔属蔬菜和油料作物育种的分子基础。研究甘蓝中大量的形态变异,包括经济营养和具有抗癌价值作物,如卷心菜、花椰菜等,揭示了多倍体基因组演化的机制和基础。芸苔属植物亚基因组之间的基因不对称丧失,TEs和串联重复的不对称扩增,偏向富集某些途径或功能的基因,在DNA序列和表达的差异,包括大量旁系同源和直系同源基因的可变剪接,共同描述了多倍化后基因组进化路线。通过这些非对称机制,可以帮助构建了多倍体基因组演化的分子模型。


研究难点:

1、通过二代测序构建甘蓝基因组;

2、比较拟南芥,甘蓝,白菜基因组。

内容解析

研究问题:

1. 组装甘蓝基因组;

2. 甘蓝基因组多倍体化事件及后续演化研究。


研究方向:与近缘物种基因组进行比较


研究成果:

1. 在本文中提供了甘蓝基因组序列草图。基因组大小为539,907,250bp,Contig N50为26,828bp,Scaffold N50为1,457,055bp。


2. 甘蓝基因组经历了基因组三倍化,并伴随基因丢失和基因重组。对三倍化后基因保留或丢失的分析,发现某些代谢途径相关基因过度保留,如氧化磷酸化、碳固定、光合作用和昼夜节律。


3. 基因表达分析揭示了重复基因分化和变异。重复基因新功能化和亚功能化提供了新的遗传可能性,是物种进化和新物种形成的基础。例如,被认为是保守的TF基因仍然有超过38%的旁系同源基因对,在不同的组织中表现出不同的表达量,尽管这一比例低于重复基因平均值。基因表达变异可能增加多倍体化后网络调控的复杂性。


4. 揭示了多倍体基因组演化的机制。芸苔属植物之间的基因不对称丢失,和串联重复序列不对称扩增,偏向富集某些途径或基因功能,在DNA序列和表达差异的多样性,包括大量旁系同源和直系同源基因可变剪接,共同构建了一个多倍化后基因组进化路径。通过这些非对称机制,描述了多倍体基因组演化的分子模型。


5. 甘蓝基因组序列及其与亲属的比较,揭示了基因组进化机制,为改良基因表型特征提供了基础,包括抗癌药物GSLs的成分。基因组也为研究甘蓝的形态多样性奠定了基础,同时也为重要的异源四倍体油菜籽或油菜籽作物的基因组分析提供了支持


研究亮点:揭示了多倍体基因组演化的机制,描述了多倍化后基因组进化路线。通过非对称机制,构建了多倍体基因组演化的分子模型。

研究方法

研究对象:甘蓝02-12株系


所用软件:

1. SOAPdenovo1.04,MUMmer-3.22—组装;

2. AUGUSTUS,GlimmerHMM,BLAT,PASA,GLEAN,tRNAscan-SE,blastn,INFERNAL—基因注释;

3. LTR_STRUC,HelSearch 1.0,RepeatMasker—重复序列注释;

4. MCScan,OrthoMCL—基因家族分析;

5. Clustal,MEGA5,PhyML—系统发育属分析;

6. Tophat—转录组分析。


所用数据:

1. 甘蓝02-12株系测序数据;

2. 白菜基因组数据;

3. 拟南芥基因组数据。


所用数据库:

SwissProt,TrEMBL,Interproscan,KEGG proteins databases,Rfam Database,GenoScope database等。

研究结果


图1 甘蓝和白菜共线性块中基因组结构和基因保留比例

(a)甘蓝,白菜和拟南芥共线性分析。之前在拟南芥中报道过的共线性块标记为A到X(用不同颜色标记);(b)WGD的时间预测以及随后两个芸苔属物种分化;(c)三个染色体组块(LF,MF1和MF2)基因保留和丢失模式。X轴代表在拟南芥中的物理位置,Y轴代表甘蓝和白菜保留基因的比例。


图2 甘蓝和白菜的TE比较分析

(a)每个甘蓝-白菜共线性块的拷贝数和总长度;(b)甘蓝-白菜共线性块在不同时间(百万年前)的完整LTR(copia-like和gypsy-like)的数量;(c) 甘蓝-白菜共线性区域跟甘蓝染色体上的TE分布和组成的比较;(d)Copia-like元件进化树。


图3 起源于串联重复和甘蓝基因组全基因组复制的重复基因

(a)维恩图显示拟南芥,白菜和甘蓝特有和共有的串联重复事件;(b,c)显示拟南芥,白菜和甘蓝串联重复基因分布和WCT / WCT起源的旁系同源基因的KEGG通路图,x轴是串联重复基因或旁系同源基因的数量与总基因的比例,y轴是串联重复基因比例下降的图谱数量;(d)在甘蓝基因组中氧化磷酸化途径通过WGT起源的旁系同源基因被富集。拟南芥,白菜和甘蓝的每个KO酶编号下面是KO酶的基因拷贝数。


图4 甘蓝和白菜中芸苔属旁系同源和直系同源基因差异

(a)甘蓝全基因组基因转换;(b)不同来源的重复基因对差异表达比例: a-全基因组复制(a -WGD),芸苔-谱系WGT,串联重复(TD)。Bol, 甘蓝; Bra, 白菜. C: 愈伤组织; R: 根; St: 茎; L: 叶; F: 花; Si: 长角果。差异表达基因的定义为差异倍数>2和FDR<0.05或只有一个能检测到基因表达(FDR< 0.05)。(c)箱形图显示了甘蓝和白菜花组织的三个亚基因组(LF,MFI和MF2)差异表达。其它组织在附录中。(d)属于转录因子(TFs) 及和该功能注释相关的重复基因的差异表达比例,低于叶组织和其它组织基因组水平平均值。(e)这些GO结果在重复基因对中含有高比例的差异表达,跟叶子和其它组织的全基因组水平相比。在这些组织中,较高表达的组织用缩写的字母表示。(f) 有相同数量外显子的WGT旁系同源基因和甘蓝-白菜直系同源基因的表达差异(不同变异或相同变异的不同表达)是由可变剪接(AS)引起的。IRES表示保留和exon跳跃的类型。


图5 在甘蓝和其近缘种全基因组范围比较芥子甙(GSL)代谢代谢通路的基因

(a) 拟南芥,甘蓝和白菜的脂质芥子甙和吲哚芥子甙生物合成和分解代谢通路。拟南芥,白菜和甘蓝GSL合成基因的拷贝数列在方括号中列出,蓝色粗体突出显示潜在抗癌物质/前体,两个重要的氨基酸链延伸和侧链修饰位点MAMs和AOP2用红色粗体突出显示,绿色括号中的数字代表无功能基因的数量。(b,c)MAMs和AOP基因的NJ树。沉默基因用红色空心圆表示,功能基因用红色实心圆和绿色矩形表示。(d) 3个甘蓝AOP2位点,一个功能AOP2和2个突变AOP2 。


表1. 甘蓝基因组组装及注释结果



【参考文献】

Liu, S. et al. The Brassica oleracea genome reveals the asymmetrical evolution of polyploid genomes. Nat. Commun. 5:3930 doi: 10.1038/ncomms4930 (2014).



点击下方“阅读原文”查看更多
 



撰稿:大项目部-胡晓晓

编辑:市场部



猜你喜欢

IBC意犹未尽?彩蛋来袭!|180+篇植物基因组文章解读大全

茄科三剑客之茄子茄科三剑客之辣椒

撑起家常菜半边天的它,到底是水果还是蔬菜?

撩妹神器,茄科颜值担当!不信你别点


近期热文

不费“一金一银”如何写出4分的肿瘤新文章?

挑战!一大波动植物来袭,你敢说自己都认识?!

糖尿病个体化治疗 | 这次科学家们把目光投向了肠道共生菌群

那个当年被嘲笑成小灵通的测序仪,现在怎么样了?

组织器官发育转录谱的构建策略|干货

颠覆!几百个细胞就能捕获全基因组活性调控序列!



请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存